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摘 要 引导 社会 成 员 重 塑 日 常 良 好 行为 习惯 是 增强 公共 政策 有 效 性 的 重要 路 径 和 切入 点 ,洞悉 并 把 握 行 为 
习惯 的 形成 机 制 对 具体 培养 策略 的 制定 和 实施 大 有 神 益 。 行为 习惯 是 指 通过 高 频 重 复 的 奖励 习 得 ,在 记忆 中 


形成 的 情境 与 反应 之 间 的 内 隐 联 结 。 


作为 一 种 特殊 的 内 隐 记 忆 系 统 , 行为 习惯 具有 自动 化 、 情 境 线索 依赖 性 、 


对 当前 奖励 低 敏感 性 等 特征 。 行 为 习惯 的 形成 机 制 包含 两 个 独立 且 共 发 的 习 得 机 制 ， 即 联结 习 得 机 制 和 奖励 
习 得 机 制 。 在 日 常 良好 行为 习惯 的 形成 初期 目标 引导 着 个 体 对 行为 价值 的 习 得 。 在 培养 社会 成 员 日 常 良好 
行为 习惯 的 过 程 中 ,应 将 情境 线索 的 稳定 性 、 高 频 行为 的 低 认 知 重复 以 及 奖励 的 合理 设置 ,作为 公共 政策 助 推 
社会 成 员 养 成 日 常 良好 行为 习惯 的 三 大 核心 策略 。 未 来 的 研究 方向 应 着 力 于 加 强 习 惯 研究 的 学 科 视 闪 融合 ， 


更 新 行为 习惯 领域 的 研究 范式 ， 重 置 公共 设施 以 提升 有 益 行为 的 易 达 性 ， 


日 常 良好 行为 习惯 的 重 塑 。 


关键 词 ” 行 为 习惯 ; 形成 机 制 ; 培养 策略 ; 公共 政策 
分 类 号 B849:C91; F270 
1 引言 


近年 来 , 在 Kahneman 和 Tversky 以 及 Thaler 
等 行为 经 济 学 家 的 影响 下 ,将 宏观 的 社会 问题 具 
体 化 为 中 微观 的 个 体 行 为 已 成 为 公共 政策 领域 的 
未 来 趋势 ( 吕 小 康 ， 武 迪 ， 附 晓 阳 , 汪 新 建 ， 程 婕 
婷 , 2018)。 公 共 政 策 试图 解决 的 社会 问题 (如 节能 
WHE. 文明 开 车 、 垃 圾 分 类 、 大 健康 、 营 养 均 衡 、 
全 民 阅 读 等 ), 通常 与 人 们 的 日 常 行为 习惯 (如 日 
党 交通 工具 的 使 用 、 随 手 关 灯 、 开 车 系 安全 带 、 
每 日 三 餐 、 日 常 锯 炼 等 ) 息 息 相 关 。 在 利用 公共 政 
策 重 塑 人 们 日 常 行为 习惯 的 过 程 中 ， 既 要 利用 自 
上 至 下 的 宣传 教育 改变 社会 成 员 的 回 有 观念 ， 也 
要 遵循 行为 层面 的 内 在 机 制 ， 自 下 至 上 地 引导 良 
好 日 常 行为 的 自觉 发 生 。Wood 和 Neal (2016) 曾 指 


{mi 


以 及 引入 商业 模式 以 共 促 社 会 成 员 


更 加 长 久 的 积极 效应 ， 它 可 以 让 良好 行为 成 为 日 
行 而 不 觉 的 自动 化 反应 ,在 没有 奖励 激励 或 者 不 
实施 自我 控制 的 情况 下 , 个 体 依 然 可 以 保持 有 益 
于 个 人 和 社会 福 社 的 日 常 行为 选择 (Wood & Neal, 
2016)。Bonini, Hadjichristidis 和 Graffeo (2018) 也 
曾 指出 ， 人 们 日 常 行为 习惯 的 弃 旧 从 新 是 实现 绿 
色 助 推 的 重要 路 径 。 

在 社会 心理 学 领域 , 习惯 被 界定 为 “通过 高 
频 重复 的 奖励 习 得 , 在 记忆 中 形成 的 情境 与 反应 
之 间 的 内 隐 联 结 ”(Wood & Riinger 2016)。 从 该 定 
义 看 , 行为 习惯 的 内 涵 具 有 如 下 三 点 特征 :1) 它 是 
一 种 内 隐 的 记忆 系统 , 不仅 在 行为 层面 表征 为 过 
去 行为 的 高 频 重复 ,也 在 认 知 层面 表征 为 “情境 
线索 -行为 反应 ”的 固定 联结 ,情境 线索 是 习惯 性 


出 , 与 传统 的 态度 说 服 与 胡萝卜 加 大 棱 式 的 奖惩 
措施 相 比 ， 遵 循 习惯 形成 机 制 实施 行为 干预 具有 
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反应 的 直接 引 因 (Gardner 2015)。2) 作 为 自动 化 机 
制 的 一 种 类 型 ， 习 惯 不 同 于 目标 、 态 度 等 动机 因 
素 , 可 以 不 经 由 意愿 的 中 介 直 接 引发 相应 的 行为 
反应 ( 杜 立 婷 , 2015)。3) 它 是 对 以 往 可 获得 奖励 的 
情境 的 习 得 结果 , 具有 对 当前 回报 的 不 敏感 性 
(Wood, Labrecque, Lin, & Riinger, 2014)。 相 较 而 言 ， 
国内 学 界 对 习惯 这 一 构 念 长 期 关注 不 够 , 不 同学 
科 和 领域 中 的 相关 研究 也 较为 分 散 ， 将 习惯 视角 纳 
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入 公共 政策 研究 更 为 鲜 见 。 
理论 层面 习惯 视角 的 缺失 ,直接 导致 现 有 的 
公共 政策 偏重 态度 说 服 ,忽略 行为 层面 的 实际 效 
果 。 比 如 ，1991 年 美国 国家 癌症 中 心 和 相关 企业 
发 起 了 一 项 名 为 每 日 5 种 果蔬 (the 5-A-Day for 
better health program) 的 健康 饮食 推广 活动 ， 旨 在 
改善 美国 国民 的 饮食 结构 ,培养 多 吃 果蔬 的 日 常 
饮食 习惯 ,6 年 后 ,在 一 项 对 该 活动 效果 的 调查 中 
发 现 ， 了 解 并 赞成 每 天 多 吃 果蔬 的 人 群 比例 从 活 
eh mid nn 
吃 5 种 果蔬 的 人 群 数量 却 没有 显著 增加 (Moore 


机 制 是 制定 相关 习惯 培养 策略 的 前 提 。 从 心理 学 
不 同 分 支 的 已 有 研究 可 知 ,无 论 是 良好 还 是 不 良 
的 行为 习惯 ， 其 形成 可 归结 为 两 个 独立 且 共 发 的 
习 得 机 制 ， 即 1) 基 于 “情境 线索 -行为 反应 ”联结 
的 机 械 化 习 得 机 制 ; 2) 对 奖励 的 model-free 习 得 机 
制 。 前 者 强调 了 习惯 的 形成 不 同 于 深思 熟 虑 的 、 

偶发 的 、 基 于 规则 的 、 由 上 至 下 的 主动 式 习 得 模 
式 , 而 是 伴随 着 情境 线索 与 行为 反应 的 简单 共 发 
而 进行 的 低 认 知 投入 、 连 续 的 、 基 于 反馈 的 、 由 
下 至 上 的 被 动 式 习 得 (Friedel et al., 2014)。 后 者 强 
调 了 奖励 在 习惯 形成 过 程 中 的 特殊 角色 。 一 方面 ， 


& aang 2015)。 这 表明 , 积极 的 态度 和 意愿 
没有 转化 为 积极 的 行为 (Louren¢o,，Ciriolo, Almeida, 
& Troussard, 2016), Wood & Neal (2016) 曾 指出 ， 
固有 习惯 的 无 意识 入 侵 是 导致 “态度 -行为 ”鸿沟 
的 主要 引 因 。 此 外 ,习惯 视角 的 缺失 亦 导 致 现 有 
公共 政策 过 于 依赖 “胡萝卜 加 大 棒 ? 式 的 奖惩 措施 


在 习惯 形成 初期 ， 奖 励 为 人 们 反复 执行 某 一 行为 
提供 了 了 驱动 力 ; 另 一 方面 ， 随 着 习惯 强度 的 提升 ， 
人 们 对 当前 奖励 或 计划 的 依赖 程度 越 来 越 弱 ， 哪 
怕 奖 励 消 失 , 依旧 会 维持 原 有 的 行为 选择 ,不 会 
受到 当前 目标 或 计划 的 影响 (Wood, 2017)。 

在 日 常生 活 中 , 无 论 是 良好 还 是 不 良 的 行为 


实施 行为 干预 。 以 往 研究 表明 ， 人 们 更 倾向 于 重 


习惯 , 其 理论 层面 的 形成 机 制 是 一 致 的 。 然 而， 从 


复 那 些 可 以 获得 奖励 或 避免 受到 惩罚 的 行为 ， 该 
方法 也 是 当前 政府 层面 实施 社会 治理 和 公共 政策 
的 常用 措施 (Ersche et al., 2016)。 比 如 , 2019 4 5 
月 1 日 正式 实施 的 《天 津 市 文明 行为 条 例 》 对 不 
同 不 文明 行为 的 罚款 额度 进行 了 详细 规定 ， 以 期 
通过 罚款 约束 人 们 的 日 常 行为 ,再 比如 , 2019 年 7 
月 1 日 上 海 市 正式 实施 的 《上 海 市 生活 垃圾 管理 

条 例 》 第 四 十 二 条 指出 ,鼓励 通过 积分 兑换 等 多 
种 活动 方式 ,促进 单位 和 个 人 形成 垃圾 分 类 投放 
的 良好 行为 习惯 。 从 效果 看 ,奖惩 措施 虽然 可 以 
在 短期 产生 一 定 积极 效应 ， 然 而 一 旦 停止 奖惩 ， 
行为 改变 大 多 随 之 中 断 ， 固 有 行为 模式 重 蹈 覆 园 
(Mantzari et al., 2015)。 

鉴于 学 界 和 业界 的 现状 与 缺憾 ， 本 文 将 基于 
社会 心理 学 领域 对 习惯 的 最 新 界定 ， 对 良好 行为 
习惯 的 形成 机 制 进行 探析 ,继而 将 其 置信 公共 政 
策 情境 ， 对 社会 成 员 日 常 良 好 行为 习惯 的 具体 培 
养 策略 进行 提炼 ,并 设 定 未 来 研究 的 着 力 点 。 


2 日 常 良好 行为 习惯 的 形成 机 制 


在 公共 政策 情境 中 ,引导 和 规范 社会 成 员 的 
日 常 行为 是 解决 社会 问题 、 实 现 公 共 治 理 目标 的 
EE 要 途径 。 基 于 行为 科学 的 观点 ， 遵循 人 在 自然 
环境 和 社会 环境 中 的 行为 规律 是 有 效 重 塑 社会 成 
日 常 行为 的 基础 。 为 此 , 厘清 行为 习惯 的 形成 


limi 


pall 


实践 层面 看 ， 良 好 行为 习惯 的 形成 比 不 良 行为 习 
惯 的 形成 更 具 挑 战 性 。 下 文 将 解析 行为 习惯 的 两 
个 习 得 路 径 ,以 及 目标 在 日 常 良 好 行为 习 虱 ee 
初期 的 作用 机 制 ， 进 而 为 公共 政策 的 制定 和 完 
提供 若干 学 理 视角 。 
21 ”基于 “情境 -反应 ”联结 的 机 械 化 习 得 机 制 

“情境 -反应 ”联结 是 指 在 大 脑 中 建立 情境 线 
索 与 相应 行为 反应 的 固定 联结 ， 它 强调 了 习惯 的 
形成 伴随 着 情境 线索 与 行为 反应 的 高 频 重 复 和 简 
单 共 发 (simple contiguity)。 作 为 自动 化 加 工 模式 
的 一 种 类 型 ， 习 惯 表 征 为 由 情境 线索 直接 引发 的 
行为 反应 , 无 需 投 入 过 多 思考 即 可 自动 发 生 (Smith 
& Graybiel, 2016)。 在 测量 习惯 强度 时 ， 利 用 被 试 
的 反应 时 间 判 断 情 境 线索 与 相应 反应 在 记忆 中 的 
认 知 联结 程度 是 最 具 预 测 效 度 和 构 念 效 度 的 方法 
(Gardner, 2015). Neal, Wood, Labrecque 和 Lally 
(2011) 曾 利用 词汇 任务 法 , 通过 情景 启动 (如 让 被 
试看 森林 、 健 身 房 的 图 片 )， 让 被 试 在 排列 混乱 的 
字母 中 识别 与 之 匹配 的 单词 (如 jogging、running)。 
反应 时 间 越 快 , 说 明 记 忆 中 “情境 -反应 ”的 联结 
越 稳 固 ， 习惯 强度 越 强 。 

从 信息 加 工 模式 视角 看 , 日常 良好 行为 习惯 
的 形成 是 由 推演 计算 模式 向 一 步 式 记忆 提取 模式 
的 转变 。 在 某 一 特定 的 情境 线索 中 ， 随 着 某 一 行 
为 反应 的 反复 练习 和 高 频 重复 , 原本 利用 外 在 记 
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忆 提 取 的 推演 计算 模式 逐步 被 一 步 式 记忆 提取 模 
式 所 取代 ,并 成 为 特定 情境 线索 中 的 默认 选项 
(Taatgen, Huss, Dickison, & Anderson, 2008)。 具体 
而 言 ， 随 着 某 一 行为 在 特定 情境 中 的 不 断 重复 ， 
原本 详细 且 具 体 的 行为 步骤 合并 成 一 个 庞大 且 高 
效 的 行为 单元 ， 在 无 意识 水 平 下 可 被 同时 选择 和 
加 载 , 阻碍 其 他 意愿 在 记忆 中 的 易 达 性 。Fujii 和 
Graybiel (2003) 指 出 ,习惯 的 形成 是 随 着 某 一 
行为 序列 在 稳定 情境 中 不 断 重 复 而 逐步 内 在 化 
(internalization) 的 过 程 。 在 这 一 过 程 中 ,该 行为 序 
列 在 记忆 中 逐渐 整合 在 一 起 ,成 为 可 以 自行 启动 
的 行为 组 块 (chunking), 一 旦 线索 出 现 , 该 行为 序 
列 即 可 被 整个 选择 和 执行 ,无 需 大 脑 的 努力 工 
作 。Wood (2017) 指 出 , 习惯 是 一 种 行为 捷径 (behavioral 
shortcut)， 感 知情 境 线索 会 让 个 体 第 一 时 间 联 想 
到 已 经 习 得 的 行为 选择 , 同时 阻碍 记忆 中 其 他 备 


= 


Markman, & Otto, 2014)。 相 较 而 言 , model-free 强 
化 习 得 模式 是 试 错 式 的 , 个 体会 对 那些 在 不 同 状 
态 和 情境 中 获得 长 期 奖励 回报 的 行为 进行 储存 ， 
继而 依靠 那些 可 以 预期 未 来 奖励 的 、 被 贮存 的 行 
为 价值 进行 后 续 的 行为 决策 ,和 model-based 习 得 
模式 相 比 ,习惯 形成 过 程 中 的 model-free 强化 习 
得 模式 缺乏 灵活 性 ， 如 果 行 为 结果 短期 发 生 了 奖 
励 回 报 的 改变 ， 也 不 会 对 已 经 贮存 的 价值 产生 太 
大 的 影响 。 因 此 ， 奖励 取消 或 价值 降低 后 人 们 是 
否 仍 然 维持 原 有 行为 是 衡量 习惯 强度 的 重要 指标 
(Wood & Riinger, 2016)。 

多 巴 胺 反应 的 提前 也 为 上 述 现 象 提供 了 更 科 
学 的 诠释 。 在 习惯 形成 过 程 中 , 作为 专门 负责 对 
奖励 产生 反应 的 神经 系统 ， 多 巴 胺 的 激活 会 逐渐 
从 对 奖励 的 反应 转移 到 预示 着 奖励 的 情境 线索 
(Wood & Neal, 2007)。 由 此 可 知 , 习惯 是 随 着 奖励 


id 


选项 的 易 达 性 。 因 此 , 一旦 日 常 良好 行为 反应 成 
为 特定 情境 线索 中 的 默认 选项 ， 人 们 便 可 以 最 少 
的 认 知 投入 实现 最 优 且 最 理性 的 行为 结果 
(Botvinick & Weinstrein, 2014)。 

脑 功 能 定位 的 相关 研究 也 表明 , 习惯 的 形成 
是 大 脑 活动 的 重新 分 配 ， 即 对 基底 神经 节 依 赖 程 
度 的 逐渐 增加 ， 对 前 额 皮 层 活路 程度 的 不 断 减弱 
(Yin & Knowlton, 2006)。 习 惯 与 基底 神经 节 密 切 
相关 ， 即 使 大 脑 其 他 区 域 处 于 睡眠 状态 或 前 人 额 皮 
层 受 损 ， 储 存在 基底 神经 节 中 的 习惯 也 会 被 自动 
启动 , 在 无 意识 中 引导 人 们 的 行为 Burton， Nakamura, 
& Roesch, 2015).Labrecque, Wood, Neal 和 Harrington 


式 反应 的 循环 往复 而 不 断 累 积 的 残留 物 ， 习 惯 的 
形成 伴随 着 奖励 的 兄长 动机 特征 逐渐 转移 到 情境 
线索 的 过 程 。(Wood & Neal, 2007). 

在 感官 层面 ， Anderson (2016) 曾 提出 在 习惯 
的 形成 过 程 中 , 个 体 的 注意 力 控制 加 工 模式 既 不 
是 从 上 至 下 的 目标 引导 机 制 (goal-direct mechanism), 
也 不 是 从 下 至 上 的 刺激 驱动 机 制 (stimulus-driven 
mechanism)， 而 是 由 价值 驱动 的 注意 力 选 择机 制 
(value-driven mechanism) o 该 机 制 强调 了 与 奖励 高 
频 共 发 的 刺激 物 对 视觉 系统 的 直接 影响 。 具 体 而 
言 ， 当 个 体 在 特定 情境 线索 中 不 断 获得 奖励 回报 
时 ,视觉 系统 会 基于 过 去 奖励 的 反馈 不 断 调 适 注 


(2017) 发 现 , 保持 简单 且 机 械 化 的 习 得 模式 是 形 
成 行为 习惯 的 前 提 ， 唤起 深思 熟 虑 的 决策 模式 反 
而 会 抑制 习惯 的 形成 。 
2.2 ”对 奖励 的 Model-free 强化 习 得 机 制 

除了 对 “情境 线索 -行为 反应 ”固定 联结 的 机 
械 性 习 得 ,习惯 的 形成 还 伴随 着 对 奖励 的 内 隐 习 
得 ， 即 Model-free 强化 习 得 模式 。 在 认 知 神经 领 
域 , Daw, Niv 和 Dayan (2005) 曾 提出 强化 习 得 的 两 
种 类 别 ， 即 基于 建 模 的 强化 习 得 (model-based RL) 
和 无 需 建 模 的 强化 习 得 (model-free RL), 两 者 之 
间 的 最 大 区 别 在 于 ,是 否 在 执行 行为 之 前 对 下 一 
步 的 状态 和 回报 进行 预测 .具体 而 言 , model-based 
强化 习 得 模式 是 计算 性 的 , 在 面 对 选 择 时 ,个 体 
会 使 用 认 知 模拟 和 前 期 计划 ， 计 算出 哪个 行为 可 
以 获得 最 大 化 的 收益 和 回报 ,继而 采取 行动 (Gershman, 


意 力 优先 权 (attention priority)， 自 动 捕捉 那些 可 
预示 奖励 回报 的 刺激 物 ， 引 导 人 们 根据 以 往 的 经 
历 , 重复 执行 那些 可 获得 奖励 的 习 得 行为 。 

基于 上 述 观 点 可 知 , 在 习惯 的 形成 过 程 中 ， 
个 体 对 奖励 的 习 得 既 不 同 于 行为 学 派 强调 的 “由 
下 至 上 ” 观 ， 也 不 同 于 计划 行为 理论 传统 范式 下 
的 “由 上 至 下 ”* 观 ,而 是 一 种 介 于 两 者 之 中 的 特殊 
机 制 ， 即 在 低 投 入 的 信息 加 工 模式 下 ,个 体 对 可 
获得 奖励 的 情境 信息 的 内 隐 习 得 。 
2.3 ”目标 在 习惯 形成 初期 的 作用 机 制 

在 公共 政策 情境 中 ,由 于 人 们 在 执行 那些 关 
乎 长 远 利益 的 日 常 良好 行为 (如 去 健身 房 锻炼 、 均 
衡 饮 食 、 安 全 开车 等 ) 时 ， 常 常 遇 到 能 满足 即刻 需 
求 的 行为 干扰 (如 刷 淘宝 、 吃 快餐 、 开 车 看 手机 等 )， 
故而 很 难 坚持 那些 有 益 于 个 体 和 社会 福 社 的 日 常 


| 


chinaXiv:202303.09421v1 


ChinaXiv 合 作 期 刊 


1212 心理 科学 进展 第 28 卷 


良好 行为 。 以 往 研究 认为 ,缺乏 意志 力 或 自我 控 
制 水 平 低 是 阻碍 人 们 持之以恒 的 重要 壁垒 。 然 而 ， 
Galla 和 Duckworth (2015) 发 现 ,高 自我 控制 的 个 
体 之 所 以 能 够 坚持 追求 某 一 目标 , 不 是 因为 有 更 
强 的 意志 力 去 抵御 眼前 的 诱惑 ， 而 是 由 于 习惯 的 
非 意 愿 中 介 机 制 让 个 体 在 拒绝 诱惑 选项 时 花费 更 
少 的 努力 。 还 有 学 者 指出 ,习惯 的 形成 亦 有 助 于 
低 自 我 控制 水 平 的 个 体 实 现 健康 的 食物 选择 (Salmon， 
Fennis, de Ridder, Adriaanse, & de Vet, 2014), Lin, 
Wood 和 Monterosso (2016) 在 一 项 利用 线 上 游戏 
探究 习惯 对 诱惑 抵御 影响 效应 的 研究 中 发 现 ， 对 
于 巧克力 爱好 者 , 一 旦 形成 了 胡 葛 卜 的 选择 习惯 ， 
哪怕 巧克力 成 为 可 得 选项 ， 他 们 也 会 自觉 选择 更 
有 益 健 康 的 胡 葛 卜 。 由 此 可 推 ,习惯 的 形成 是 助 
推 个 体 实现 长 期 目标 追求 的 重要 路 径 ， 同 时 ， 目 
标 追 求 也 是 行为 习惯 得 以 形成 的 必要 前 提 。 

有 学 者 曾 提出 目标 环 路 模型 (goal circuit model), 
指出 目标 塑造 着 习惯 的 习 得 ,习惯 一 旦 形成 ， 亦 
会 反 过 来 促进 目标 追求 。 该 模型 认为 ， 在 习惯 性 
行为 成 为 默认 选项 之 前 ,其 行为 选择 一 开始 深 受 
目标 系统 的 影响 。 随 着 个 体 在 特定 环境 中 反复 追 
求 某 一 目标 , 习惯 系统 才 逐 渐 有 能 力 自 动 执行 特 
定 的 行为 序列 ,而 不 受 当前 目标 的 影响 (Cooper, 
Ruh, & Mareschal, 2014)。 或 者 说 ,习惯 可 以 看 作 
是 在 目标 追求 范式 下 不 断 重复 某 一 行为 的 产物 。 
随 着 反复 练习 和 经 验 增加 ,习惯 系统 对 可 获得 价 
值 行为 的 计算 愈 发 可 靠 , 从 而 取代 计算 成 本 更 高 
的 目标 引导 系统 对 行为 的 控制 (FitzGerald，Dolan， 
& Friston，2014)。 由 于 目标 在 习惯 形成 初期 决定 
着 个 体 对 行为 价值 的 习 得 ,习惯 形成 后 的 行为 反 
应 大 多 会 与 目标 保持 一 致 (Pezzulo, Rigoli, & Chersi, 
2013)。 正 因为 此 ,人们 通常 会 将 目标 感知 为 习惯 
性 行为 的 引 因 ， 忽略 情境 线索 对 行为 反应 的 直接 
作用 (Neal et al., 2011)。 由 于 大 多 数 人 对 自身 习惯 
性 行为 的 引发 机 制 缺乏 了 解 ， 导 致 传统 的 自我 汇 
报 法 很 难 准 确 测 量 习惯 的 强度 (Labrecque et al., 
2017)。 

小 结 而 言 ， 习 惯 的 形成 既是 在 记忆 中 建立 情 
境 线索 与 行为 反应 之 间 固 定 联 结 的 过 程 ， 也 是 在 
低 认 知 的 决策 模式 下 ,通过 奖励 习 得 赋予 情境 线 
索 注 意 力 优先 权 以 及 动机 属性 的 过 程 。 在 习惯 形 
成 初期 , 目标 有 助 于 驱动 人 们 置身 于 某 一 情境 中 
反复 执行 某 一 日 常 良好 行为 ,这 正 是 在 记忆 中 建 


立 “ 情 境 线 索 - 行 为 反应 ”固定 联结 的 重要 前 提 。 
3 ”日常 良好 行为 习惯 的 培养 策略 

基于 上 述 形 成 机 制 的 梳理 可 知 , 为 了 引导 社 
会 成 员 养 成 日 常 良好 行为 习惯 ,政策 制定 者 需要 
把 握 习 惯 形成 过 程 中 的 三 个 核心 要 素 ， 即 情境 线 
索 的 设置 、 高 频 行 为 的 低 认 知 重复 以 及 目标 或 奖 
励 的 合理 提供 。 下 文 将 基于 上 述 理论 层面 的 研究 
成 果 ， 围 绕 三 个 核心 要 素 ， 针 对 公共 政策 的 具体 
制定 和 实施 提出 如 下 几 点 建议 ,可 简要 将 其 归纳 
为 “三 个 注重 ”。 

3.1 注重 情境 线索 的 稳定 性 

稳定 的 情境 线索 既是 建立 线索 与 反应 固定 联 
结 的 前 提 ， 也 是 习惯 形成 初期 促使 个 体 将 积极 意 
愿 转化 为 行为 的 保障 。 有 研究 发 现 ， 几 乎 90% 有 
规律 的 锻炼 者 都 有 固定 的 地 点 或 时 间 进 行 锻炼 ， 
当 人 们 身 处 于 这 些 线索 (如 海边 、 健 身 房 )， 执 行 锻 
炼 行为 的 自动 化 程度 会 增强 (Tappe, Tarves, Oltarzewski, 
& Frum, 2013)。 在 一 项 关于 老年 人 服药 行为 的 研 
究 中 发 现 ， 当 吃 药 的 行为 在 家 中 某 个 特定 场景 中 
完成 ， 服 药 行 为 更 易于 坚持 (Brooks et al., 2014). 
因此 , 政策 制定 者 在 培养 社会 成 员 良 好 行为 习惯 
的 过 程 中 , 应 首先 确保 情境 线索 的 稳定 性 ， 并 将 
以 下 三 点 策略 纳入 考量 。 

其 一 , 借助 情境 线索 建立 实施 计划 。 实 施 计 
划 是 指 鼓 励 人 们 基于 if-then 模式 建立 一 个 具体 的 
执行 方案 。 比如 ,每 天 在 刷牙 之 后 , 使 用 牙 线 清洁 
FE, 每 天 上 床 睡觉 之 前 , 在 卧室 的 地 板 上 做 三 
组 俯卧 撑 。 实 施 计 划 通 常会 为 行为 的 执行 提供 一 
个 前 提 条 件 , 它 的 设置 有 助 于 人 们 在 习惯 形成 初 
期 在 记忆 中 建立 “情境 线索 -行为 反应 ”的 固定 联 
结 ,， 也 有 助 于 跨越 “态度 -意愿 ”鸿沟 。 基 于 情境 线 
索 制 定 的 实施 计划 会 让 持 有 积极 意愿 的 人 们 更 可 
能 付 诸 于 行为 ,削弱 行为 对 当前 意愿 的 依赖 ， 加 
速 习 惯 强度 的 提升 (Rogers, Milkman, John, & 
Norton, 2015)。 值得 注意 的 是 , 该 策略 只 对 那些 已 
经 具有 积极 意愿 的 人 群 有 效 。Orbell 和 Verplanken 
(2010) 指 出 ,实施 意愿 是 建立 习惯 路 径 的 重要 方 
式 。 当 人 们 在 稳定 的 情境 线索 中 按照 主观 意愿 高 
频 重复 某 一 行为 时 , 个 体 的 决策 对 意愿 的 依赖 逐 
渐 减 弱 ， 对 习惯 的 依赖 逐渐 增强 。 为 此 ， 公 共 政 策 
制定 者 在 引领 社会 成 员 重 塑 良 好 行为 习惯 的 过 程 
中 ,可 以 引入 情景 线索 的 设置 ， 帮 助 个 体 将 积极 
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的 意愿 转化 为 具体 的 行为 。 目 前 ， 上 海 市 部 分 社 
区 在 展开 垃圾 分 类 工作 中 实施 的 “定时 定点 投放 ” 
策略 ， 有 效 保证 了 日 常 垃圾 分 类 投放 行为 发 生 情 
境 线索 的 稳定 性 。 此 外 , 在 “全 民 阅 读 ” 的 推广 活动 
中 ,也 可 以 鼓励 人 们 根据 自己 的 喜好 ,制定 一 份 
详细 的 阅读 计划 表 ， 定 时 定点 完成 每 日 的 阅读 
量 。 久 而 久之 ， 人 们 便 会 在 固定 的 情境 线索 中 自 
党 执行 书籍 的 阅读 行为 ， 而 无 需 在 刷 手机 还 是 看 会 
儿 书 的 抉择 中 犯难 。 

其 二 ,将 已 有 的 日 常 行为 习惯 作为 情境 线索 ， 
在 旧 习 惯 的 基础 上 累积 新 习惯 (piggyback)。 情 境 
线索 不 仅 包 括 简单 的 环境 因素 ， 如 时 间 、 地 点 、 
其 他 人 在 场 , 也 包括 个 体 的 内 在 状态 (Wood，2017)， 
或 已 形成 的 日 常 惯例 (如 每 日 三 餐 等 )。* 有 研究 表明 ， 
相 较 于 要 求 被 试 在 特定 时 间或 地 点 使 用 牙 线 , 在 
刷牙 后 立刻 练习 牙 线 的 策略 更 容易 成 功 地 建立 长 
期 使 用 牙 线 的 习惯 (Thaler Sunstein, & Balz, 2012; 
Judah, Gardner, & Aunger, 2013)。 在 人 们 的 日 常生 
活 中 ,大量 行为 惯例 的 存在 为 借助 附加 模式 培养 
新 习惯 提供 了 大 量 机 会 (Labrecque et al., 2017)。 比 
如 ， 针 对 阿富汗 新 生 儿 疫苗 接种 率 低 的 社会 问题 ， 
麦 肯 世 界 基 金 会 借助 当地 儿童 佩戴 禄 福 手 环 的 已 
有 习惯 ,， 曾 与 阿富汗 卫生 部 合作 开发 了 一 款 “ 免 
疫 手链 ”用 来 记录 疫苗 接种 情况 。 孩 子 每 接种 一 
个 疫苗 ， 手 环 上 就 会 添加 一 颗 相 应 颜色 的 彩 珠 。 


TT 


体 策 略 如 下 : 

其 一 , 行为 反应 尽量 简单 直观 。 关 于 习惯 养 
成 , 坊间 流传 着 21 天 或 28 天 养 成 一 个 习惯 的 说 
法 , 但 学 术 界 至 今 未 给 出 确切 的 数字 。 有 人 研究 表 
BA, 有 些 简单 的 行为 只 需要 重复 18 天 即 可 形成 习 
惯 , 无 需 思考 便 能 自发 执行 ,但 是 ， 有 些 复 杂 的 行 
为 或 对 于 有 些 被 试 而 言 ， 超过 200 天 的 重复 都 是 
不 够 的 (Wood & Neal, 2016)。 FJ IL, 重复 的 具体 频 
次 会 因为 个 体 对 行为 感知 难 易 程度 的 不 同 而 产生 
差异 ,， 感知 困难 程度 越 高 ， 习 惯 的 形成 周期 越 长， 
感知 困难 程度 越 低 ， 周 期 则 越 短 。 针 对 这 一 规律 ， 
除了 尽量 延长 行为 干预 的 时 间 外 ， 有 学 者 发 现 ， 
将 行为 分 解 成 具体 的 动作 ,反复 示范 ,引导 人 们 
直接 进入 行为 的 操作 环节 ， 有 助 于 培养 较为 复杂 
的 行为 习惯 。 该 方法 可 以 有 效 避 免 由 态度 说 服 引 
发 的 自我 耗竭 (Neal, Vujcic, Hernandez, & Wood, 
2015)。 因 此 , 在 公共 政策 情境 中 ,政策 制定 者 在 
使 用 传统 教化 宣传 等 策略 的 同时 ， 应 配合 具体 行 
为 的 示范 和 练习 。 比 如 ， 为 了 培养 偏远 地 区 学 生 
如 而 后 洗手 的 习惯 ,老师 可 以 在 学 校 或 其 他 可 控 
环境 内 ,带领 学 生 们 从 厕所 出 来 后 直接 走 到 洗手 
池 、 打 开水 龙头 ， 而 非 仅仅 告知 他 们 洗手 的 益处 。 
垃圾 分 类 投放 习惯 的 培养 也 可 以 参考 类 似 的 方式 ， 
比如 由 游 族 网 络 研发 的 功能 游戏 “垃圾 分 分 分 ”， 
旨 在 让 用 户 通过 游戏 模拟 练习 不 同 垃圾 的 分 类 投 
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这 一 尝试 正 是 借用 新 旧 习 惯 累加 的 方式 , 将 定期 
注射 疫苗 的 新 习惯 建立 在 当地 居民 的 已 有 习惯 之 
上 。 再 比如 ,针对 印度 部 分 地 区 青少年 没有 洗手 
习惯 而 导致 的 卫生 隐患 ， 沙 威 龙 品牌 研发 了 一 款 
粉笔 肥皂 。 人 们 用 该 产品 写字 后 , 产生 的 粉笔 灰 
遇 到 水 、 经 揉搓 后 会 产生 泡沫 从 而 达到 消毒 的 
效果 。 这 一 产品 亦 是 在 当地 学 童 们 使 用 粉笔 学 习 写 
字 的 已 有 习惯 基础 上 , 附加 了 使 用 肥皂 的 新 习惯 。 
3.2 ”注重 行为 的 高 频 重 复 

高 频 重 复 是 建立 情境 线索 与 行为 反应 认 知 联 
结 的 主要 前 提 ， 也 是 奖励 习 得 的 必要 条 件 。 由 于 
习惯 强度 的 提升 伴随 着 个 体 对 当前 目标 和 意愿 依 
赖 程度 的 减弱 , 行为 的 高 频 重 复 需要 遵循 低 认 知 
努力 并 基于 反馈 的 机 械 式 习 得 模式 ， 避 免 高 认 知 
努力 和 基于 规则 的 反省 式 习 得 模式 。 因 此 ， 若 想 
成 功 地 培养 习惯 ,政策 制定 者 应 注意 , 在 引导 个 
体高 频 重 复 某 一 行为 反应 时 ,应 尽量 保持 简单 且 


放 。 该 方式 不 仅 降低 了 垃圾 分 类 投放 行为 的 感知 
难度 , 在 反复 练习 的 过 程 中 ,也 逐渐 抑制 了 深思 
熟 虑 决策 模式 的 启动 。 同 理 , 在 社区 或 学 校 范 围 
内 组 织 线 下 的 垃圾 分 类 小 游戏 ， 亦 有 助 于 实现 垃 
圾 分 类 投放 习惯 培养 的 常态 效应 。 

其 二 , 慎重 使 用 提醒 功能 。 原 因 之 一 在 于 ， 提 
醒 功 能 容易 让 人 们 产生 提醒 依赖 ， 而 非 建立 情境 
线索 与 行为 反应 的 固定 联结 。 换 句 话 说， 提醒 的 
频繁 使 用 ， 让 人 们 对 提醒 功能 产生 自动 化 反应 ， 
提醒 功能 本 身 成 为 行为 反应 的 刺激 物 。 一 旦 提醒 
WA, 行为 反应 也 随 之 中 断 。 原 因 之 二 在 于 ,提醒 
功能 会 让 目标 凸显， 抑制 行为 习惯 的 形成 (Austin 
& Kwapisz, 2017)。 有 学 者 指出 ， 当 提醒 让 行为 的 
目标 更 加 凸显 时 , 会 阻碍 情境 与 反应 这 一 固定 联 
结 在 记忆 中 的 建立 (Gillan,，Otto, Phelps, & Daw, 
2015)。 还 有 学 者 发 现 ， 提 醒 功 能 虽然 在 习惯 形成 
初期 可 以 短暂 地 促进 行为 的 重复 ， 然 而 若 想 培养 


机 械 化 的 模式 ,避免 唤 起 反省 式 的 决策 模式 。 具 


具有 自动 化 特征 的 行为 习惯 , 需要 在 设计 提醒 信 
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息 时 ， 将 需要 执行 的 具体 行为 与 某 个 稳定 的 情境 
线索 相 联结 (Stawarz, Cox, & Blandford, 2015)， 比 
如 “请 记得 在 刷牙 后 使 用 牙 线 ?或 “请 记得 在 睡觉 
前 做 十 个 俯卧 撑 ”。 类 似 于 上 文 提 及 的 建立 实施 意 
愿 的 策略 ,该 类 提醒 更 符合 习惯 形成 的 内 在 机 
制 。 在 制定 节能 减 排 提醒 标语 时 ,公共 政策 制定 
者 或 执行 人 员 可 以 参照 该 策略 ,将 随手 关 灯 、 拔 
掉 电 源 、 开 空调 关门 窗 等 具体 的 行为 反应 与 特定 
情景 线索 相 联 结 ， 比 如 提示 “请 在 锁 门 之 前 关闭 
室内 所 有 电源 ”。 

其 三 , 慎重 使 用 量化 信息 。 随 着 互联 网 和 移 
动 信息 技术 的 发 展 , 很 多 可 穿戴 智能 设备 都 可 以 
通过 行为 追踪 对 人 们 的 行为 进行 监控 与 实时 反 
馈 。 有 研究 表明 ,追踪 结果 的 反馈 虽然 会 短期 促 
进 人 们 实施 积极 行为 ， 然 而 一 旦 反馈 停止 ， 便 很 
难 长 期 维持 (Stawarz et al., 2015)。 其 中 一 个 可 能 的 
原因 是 , 追踪 结果 的 反馈 通常 以 数字 的 形式 呈现 ， 
易于 引发 系统 2 的 反省 式 决策 模 式 , 继而 抑制 习 
惯 的 机 械 化 习 得 和 对 奖励 的 内 隐 和 学习， 无 法 保证 
行为 干预 的 长 期 效果 。 此 外 ,自我 量化 领域 的 已 
有 研究 也 证 实 ， 自 我 量化 的 信息 虽然 可 以 短期 改 
善 日 常 行为 , 但 对 个 体 的 继续 参与 意愿 和 享乐 程 
度 有 消极 影响 (Etkin，2015; FRH, ThE AR, 
2018)。 目 前 ,在 全 国 各 地 推行 垃圾 分 类 投放 行为 


体 的 低 认 知 习 得 状态 。 

其 一 ， 奖 励 以 及 奖励 的 行为 越 具体 越 好 。 尤 
其 在 习惯 形成 初期 ， 对 具体 的 行为 提供 奖励 会 增 
加 入 们 执行 那些 具有 长 期 利益 的 行为 动机 ， 也 更 
容易 让 人 们 反思 享乐 活动 (如 吃 冰 淇 凌 ) 可 能 带 ; 
的 损失 。 这 样 的 思考 过 程 有 助 于 个 体 执行 更 优 的 
行为 选择 (Wood & Neal, 2016)。 同 理 ， 奖 励 本 身 也 
越 具 体 越 好 。 相 比 于 宽泛 的 奖励 ， 具体 奖励 在 培 
养 习 惯 时 可 能 具有 较 高 的 成 功率 (Wood & Neal, 
2016), 具体 的 奖励 包括 象征 意义 的 奖杯 、 奖 牌 ， 
或 是 某 些 具有 重要 意义 的 时 间 节 点 ， 如 生日 或 是 
新 年 伊始 。 对 此 类 具体 奖励 的 习 得 ， 既 有 助 于 强 
化 情境 线索 与 行为 反应 的 联结 习 得 ， 也 会 让 奖励 
的 价值 有 效 地 转移 至 特定 的 情境 线索 。 

其 二 ， 奖 励 需 要 具有 随机 间隔 或 不 确定 性 。 
最 新 研究 发 现 ， 不 确定 性 的 奖励 对 重复 性 行为 具 
有 双重 驱动 力 , 除了 奖励 本 身 的 积极 回报 ,满足 
不 确定 感 引发 的 好 奇 心 亦 是 一 种 奖励 回报 ,积极 
影响 个 体 持续 参与 某 一 行为 的 意愿 (Shen, Hsee, & 
Talloen, 2019)。Wood 和 Neal (2016) 认 为 ， 持 续 性 
的 、 可 预期 的 奖励 会 有 效 驱动 行为 的 短期 改变 ， 
但 长 期 效果 并 不 理想 。 在 一 项 关于 健身 房 如 何 培 
养 顾 客 长 期 惠顾 习惯 的 研究 表明 ， 与 不 确定 的 奖 
励 相 比 ， 每 次 健身 后 得 到 固定 奖励 的 被 试 反而 不 


的 过 程 中 , 很 多 社区 利用 智能 化 技术 实现 了 对 居 
民 垃 圾 分 类 投放 行为 的 量化 追踪 和 考核 。 从 宏观 
层面 看 ,量化 信息 有 助 于 利用 大 数据 实现 公共 政 
策 的 制定 实施 与 效果 评估 ,但 是 从 微观 层面 看 ， 
量化 信息 的 反馈 可 能 会 阻碍 个 体 行为 习惯 的 形 
成 。 因 此 , 在 设计 量化 反馈 信息 时 ， 可 以 尽量 用 直 
观 的 可 视 化 图 形 代替 精确 的 数字 ， 确 保 个 体 在 低 
认 知 投入 的 决策 模式 中 维持 该 行为 的 高 频 重 复 
促进 “情境 线索 -行为 反应 ”固定 联结 在 记忆 中 的 
形成 。 
3.3 ”注重 目标 和 奖励 的 合理 设置 

奖励 作为 一 把 双 刃 剑 ， 它 一 方面 可 以 在 习惯 
形成 初期 为 人 们 反复 执行 目标 追求 行为 提供 动力 
男 一 方面 易于 唤起 个 体 有 意识 的 、 基 于 规则 的 决 


易于 形成 惠顾 习惯 ,奖励 一 旦 停止 , 大 部 分 顾客 
的 惠顾 行为 也 会 终止 (Beshears, Lee, Milkman, & 
Mislavsky，2017)。 部 分 原因 在 于 ， 可 预期 的 奖励 
会 让 人 们 对 目标 行为 的 感知 更 加 困难 、 淘 望 程度 
更 低 , 认为 在 不 提供 奖励 的 情况 下 不 值得 执行 
(Gneezy, Meier, & Rey-Biel, 2011)。 在 现实 生活 中 ， 
老虎 机 是 利用 不 确定 奖励 培养 行为 习惯 的 最 佳 案 
例 ， 具 有 随机 间隔 和 价值 不 确定 性 的 奖励 系统 会 
被 认 作 是 赌博 的 可 卡 因 。 为 此 , 在 激励 人 们 执行 
有 益 于 社会 福 社 的 良好 行为 (如 垃圾 分 类 、 绿 色 出 
行 、 日 党 锻炼、 深度 阅读 等 ) 时 ,可 将 不 确定 性 的 奖 
励 设 置 适当 引入 “积分 制 ? 或 “奖品 兑换 ”等 党 用 激 
励 策略 中 。 再 比如 , 在 鼓励 社会 成 员 绿 色 出 行 的 
活动 中 ,可 以 尝试 每 年 随机 设立 可 免费 乘坐 公共 


策 模式 ,抑制 内 隐 的 、 基 于 反馈 的 习惯 性 习 得 模 
式 (Carden, Wood, & Neal, 2017)。 因 此 ， 若 要 兼顾 
上 述 两 个 方面 ,奖励 的 设置 既 需 要 为 个 体 开始 并 
重复 目标 追求 行为 提供 足够 的 驱动 力 ， 又 需要 避 
免 唤起 高 认 知 投入 和 反省 式 的 决策 模式 ， 保 持 个 


交通 工具 的 “绿色 出 行 日 "。 作 为 双重 的 积极 回报 ， 
不 确定 性 奖励 设置 会 优 于 持续 性 且 可 预期 的 奖励 ， 
有 助 于 习惯 性 联结 的 建立 ， 同 时 节约 经 济 成 本 。 
需要 强调 的 一 点 是 , 习惯 视角 下 的 奖励 是 一 
个 较为 宽泛 的 概念 ， 既 包括 外 在 奖励 和 内 在 奖励 ， 


和 
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也 涉及 个 人 利益 和 社会 利益 (如 社会 接受 .自尊 等 ) 
(Wood, 2017)。 简 言 之 , 能 带 来 淘 望 行为 结果 的 回 
报 都 属于 奖励 的 范畴 ， 比 如 小 额 金钱 的 刺激 、 他 
人 的 反馈 或 认可 、 积 极 的 情绪 、 达 到 某 目 标 后 的 
成 就 感 等 等 。 为 此 ,公共 政策 制定 者 在 引导 社会 
成 员 培 养 良 好 行为 习惯 的 过 程 中 ,同样 可 以 考虑 
多 样 化 的 奖励 设置 ， 如 对 赌 协 议 的 引入 等 。 

简 言 之 , 为 了 促进 社会 成 员 日 常 良好 行为 习 
惯 的 养 成 ， 相 关公 共 政 策 制定 和 实施 需要 综合 考 


场景 ， 加 之 激活 习惯 性 反应 的 真正 线索 难以 准确 
识别 ， 导 致 利 用 阅读 情境 材料 启动 习惯 性 行为 模 
式 的 方法 并 不 可 行 ( 杜 立 婷 ， 李 东 进 , 2017)。 原 因 
之 三 在 于 ， 由 于 习惯 的 形成 是 一 个 渐进 且 长 期 的 
过 程 , 在 实验 室 条 件 下 很 难 短期 完成 ， 这 为 习 | 
研究 的 实验 操纵 方法 设计 提出 挑战 (Bless & 
Burger, 2016)。 目 前 ， 社 会 心理 学 领域 正在 尝试 以 
线 上 游戏 的 方式 训练 并 操纵 被 试 形 成 新 的 习惯 
(Wood, 2017)。 在 一 项 关于 目标 提示 对 习惯 形成 影 


aH 


虑 情境 线索 稳定 性 、 奖 励 设置 合理 性 和 行为 重复 
高 频 性 这 三 个 核心 策略 .Wood 和 Neal (2016) 认 为 ， 
上 述 培养 策略 的 综合 使 用 效果 更 佳 。 


4 未 来 研究 展望 


在 公共 政策 领域 , 习惯 视角 的 引入 有 助 于 让 
公共 政策 制定 者 意识 到 ,除了 态度 说 服 和 利用 奖 
惩 措 施 改变 行为 习惯 外 , 巧妙 地 利用 稳定 的 情境 
线索 、 机 械 化 的 高 频 重复 以 及 符合 习惯 形成 机 制 
的 奖励 设置 有 助 于 将 宏观 层面 的 政策 导向 转化 
为 个 体 的 自觉 行为 。 未 来 研究 拟 可 重点 关注 以 下 
四 个 方面 : 
4.1 加强 习 惯 研究 的 学 科 视 域 融合 

目前 , 习惯 研究 受到 学 科 视 域 制 裂 的 局 限 。 
以 概念 界定 为 例 ,社会 学 和 心理 学 领域 对 习惯 内 
涵 的 界定 是 两 条 岔路 。 本 文通 过 引入 社会 心理 学 


响 效果 的 研究 中 , 研究 者 尝试 让 被 试 在 计算 机 设 
备 上 完成 寿司 制作 的 游戏 ,通过 特定 行为 步骤 的 
设置 以 期 通过 高 频 重 复 , 检验 在 有 提示 和 无 提 
示 的 情况 下 习惯 形成 的 效果 。 利 用 线 上 游戏 培养 
习惯 的 优点 在 于 , 它 比 田野 实验 更 容易 操作 ， 有 
助 于 在 实验 室 条 件 下 探究 习惯 形成 过 程 中 的 黑箱 ， 
可 以 灵活 地 引入 神经 科学 的 方法 ， 对 被 试 的 脑 活 
动 进 行 追踪 ,加强 数据 的 多 元 性 。 从 某 种 意义 上 
说 ， 当 前 行为 习惯 研究 范式 的 僵化 直接 导致 了 学 界 
和 业界 对 人 们 日 常 行为 习惯 形成 机 制 的 片面 认 知 ， 
妨碍 并 削弱 了 公共 政策 领域 对 习惯 这 一 构 念 的 关 
注 。 未 来 研究 应 在 行为 习惯 的 研究 范式 方面 进行 
大 胆 尝 试 和 创新 , 挖掘 更 具 操 作 性 的 研究 范式 。 

4.3” 重 置 公共 设施 以 提升 良好 行为 的 易 达 性 

基于 助 推理 论 可 知 ， 外 在 环境 的 选择 框架 可 
帮助 人 们 做 出 更 有 益 的 选择 。 同 理 , 通过 巧妙 


— 


N= 


领域 的 习惯 定义 ， 揭 示 了 习惯 与 目标 、 态 度 同 样 
是 个 体 行为 决策 的 重要 驱动 力 。 与 心理 学 领域 在 
个 体 封 闭 系统 中 强调 习惯 的 反射 属性 不 同 , 社会 
学 领域 倾向 在 个 体 与 社会 互动 的 开放 系统 中 强调 
习惯 的 集体 属性 ,更 凸显 了 和 群体 在 认 知 层面 上 的 
好 选择 (Gliveanu, 2012)。 未 来 研究 可 以 围绕 具 
体 公 共 政 策 的 制定 与 实施 ， 打破 各 学 科 之 间 的 辟 
又 ,引入 社会 学 领域 的 习惯 研究 成 果 ， 从 群体 层 
面 探讨 行为 习惯 的 干预 与 治理 ， 更 加 系统 地 理 
解 、 预 测 和 干预 社会 成 员 的 日 常 行为 举止 , 提高 
相关 公共 政策 的 科学 性 、 合 理性 和 有 效 性 。 
4.2 ”更 新 行为 习惯 领域 的 研究 范式 

由 于 行为 习惯 具有 无 意识 入 侵 的 特征 ,传统 
的 实验 范式 不 是 习惯 研究 的 理想 选择 。 原 因 之 一 
在 于 , 个 体 通 常 无 法 准确 判断 哪些 行为 是 习惯 性 
W, 哪些 不 是 ， 利用 量 表 进 行 自我 汇报 的 方法 很 
难 准 确 测量 习惯 强度 (Labrecque et al., 2017). JRA 
之 二 在 于 , 实验 室 环 境 无 法 完全 还 原 真 实 的 生活 


设置 外 在 环境 或 设施 增强 良好 行为 的 易 达 性 ， 有 
助 于 机 械 化 习 得 机 制 的 顺利 进行 ,避免 个 体 在 反 
复 执行 某 一 更 优 行为 的 过 程 中 启动 深思 熟 虑 的 决 
策 模式 。 利 用 外 在 环境 的 重 塑 ， 可 以 引导 个 体 在 
不 启动 意志 力 的 情况 下 仍 可 以 执行 更 优 的 行为 选 
择 。 有 研究 表明 , 住所 离 公园 较 近 的 美国 居民 会 
参与 更 多 的 休闲 体育 锻炼 ， 肥 胖 比例 明显 低 于 平 
均值 。 住 在 地 铁 周边 、 离 出 售 新 鲜 食 物 超市 较 近 
的 人 群 ， 蔬果 消费 更 多 ,肥胖 比例 更 低 (Wood & 
Neal, 2016). 因此 ,为 了 促进 社会 成 员 日 常 良 好 行 
为 习惯 的 养 成 ,政府 部 门 可 以 在 公共 政策 制定 的 
基础 上 ， 加 大 公共 环境 设施 的 投入 和 升级 , 通过 
提升 更 优 行为 选项 的 可 达 性 、 去 除 已 有 行为 习惯 
的 情境 线索 等 方式 更 为 柔性 地 重 塑 社会 成 员 日 
常 行为 习惯 。 未 来 研究 的 重点 可 以 基于 习惯 形成 
过 程 中 的 内 在 机 制 和 三 个 核心 元 素 , 结合 具体 情 
境 下 的 具体 行为 ,开拓 公共 政策 与 建筑 设计 、 公 
共 空 间 设计 等 领域 的 融通 性 , 为 旨 在 培养 社会 成 
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员 日 常 良 好 行为 习惯 的 公共 政策 制定 与 执行 提供 ERMENE KERI. EAR, 14(7), 1070-1078. 
学 理 支撑 。 李 东 进 ， 张 宇 东 . (2018). 消费 领域 的 量化 自我 : 研究 述评 
= , a 与 展望 . OMAK DAZE, 40(1), 3-17. 
4.4 Me SE sk A SEAR at SA BS A 
和 吕 小 康 ， 武 迪 ， 隋 晓 阳 , 汪 新 建 ， 程 婕 婷 . (2018). 从 “理性 


培养 

在 “商业 向 善 ” 的 大 背景 下 ， 越 来 越 多 的 企业 
承担 起 社会 服务 的 公共 功能 ， 乐 于 通过 创新 性 产 
品 或 服务 的 研发 和 推广 ,解决 社会 问题 ， 将 提高 
人 类 福 社 作为 企业 的 使 命 与 愿景 。 比 如 ， 阿 里 巴 
巴 推出 的 蚂蚁 和 森林 应 用 ， 利 用 线 上 游戏 化 的 设计 
和 线 下 种 树 ， 引 导 用 户主 动 关注 自身 碳 排 放 的 同 
寸 ， 也 改变 了 固有 的 日 常 行为 习惯 。 和 公共 政策 
的 行为 干预 相 比 ,将 商业 化 模式 引入 社会 成 员 良 
习惯 的 重 塑 系统 可 以 抵消 个 体 对 公共 政策 的 抵 
触 情绪 ， 有 助 于 公共 政策 推行 效果 的 长 效 化 。 但 
从 现 有 情况 看 ， 由 于 缺乏 对 习惯 形成 等 理论 机 制 
的 认 知 和 把 握 ， 很 多 关于 行为 习惯 培养 的 产品 或 
服务 ， 其 效果 并 不 理想 。Stawarz 等 人 (2015) 曾 对 
应 用 商店 中 习惯 养 成 类 应 用 的 培养 策略 进行 汇总 
和 排序 ,结果 显示 , 任务 追踪 (task tracking) 和 提 
醒 (reminder) 是 目前 最 常用 的 方法 。 然 而 ,这 两 种 
策略 在 行为 干预 的 过 程 中 过 于 凸显 目标 追求 ， 忽 
略 了 习惯 形成 中 涉及 的 特殊 习 得 机 制 。 相 较 而 言 ， 
基于 已 有 日 常 惯例 (routine creatiom) 建 立新 习惯 
的 策略 ， 虽 然 与 行为 习惯 形成 的 心理 机 制 最 为 契 
合 , 但 实践 领域 的 应 用 最 少 。 未 来 研究 可 以 将 习 
惯 理论 引入 商业 领域 (如 新 产品 的 研发 与 推广 、 互 
联网 产品 交互 设计 等 )， 遵循 习惯 形成 的 内 在 机 制 ， 
将 绿色 出 行 、 节 能 环保 、 垃 圾 分 类 投放 、 健 康 饮 
食 、 文 明 行 为 等 关乎 国民 生计 的 日 常 良 好 行为 习 
惯 重 塑 融入 产品 研发 或 营销 活动 中 ,促进 个 人 和 
社会 福 社 的 提升 。 

简 言 之 ,如 何在 学 科 整 合 的 视 阔 中 继续 探析 
行为 习惯 的 概念 内 涵 和 内 在 机 制 ， 如 何 利用 田野 
实验 或 其 他 研究 范式 对 习惯 相关 的 理论 假设 进行 
实证 检验 ， 如 何 利 用 公共 设施 的 重 置 助 推 个 体 做 
出 更 理性 、 更 环保 , 更 利他 的 日 常 行为 决策 ， 如 何 
普 助 商业 模式 以 共 促 社 会 成 员 良 好 习惯 的 形成 ， 
这 些 议题 都 是 未 来 值得 深入 研究 的 着 力 点 。 
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Mechanisms and strategies for cultivating behavioral habits 
within the field of public policy 
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Abstract: Restructuring daily habits is one of the most effective ways to solve social problems in the field 
of public policy. Understanding how to build behavioral habits is valuable for policy makers to develop and 
implement policies that support public health and wellness. Behavioral habits are context-response 
associations that develop through instrumental learning and rewards. As a type of implicit memory system, 
behavioral habits exhibit features, such as automaticity, context-dependence, and the ability to forgo 
alternative, immediate rewards. Behavioral habit formation emerges through two learning mechanisms: 
“context-response” association learning and implicit rewards learning. Psychology reveals that building 
successful habits depends not only on repetition but also on the presence of stable context cues and the 
rewards provided. In the early stages of habit formation, goals motivate individuals to repeat beneficial 
behaviors. Based on the core valences in the process of cultivating good behavioral habits, we outline three 
intervention strategies for public policy makers, including context stability, repetition, and rewards, which 
will enable them to better understand habits and design strategies that assist in cultivating behavioral habits. 
Further research would explore habits from a more diverse range of fields, experiment with new research 
paradigms, examine the possibility of redesigning public facilities for the purpose of increasing access to 
beneficial behaviors, and collaborate with commercial businesses to nudge members of society to restructure 
their daily routine. 
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